import pandas as pd

# 定义文件路径
click_file_path = '/data/GuoCu_data/processed_data/feature/user/user_inter_click.csv'
login_file_path = '/data/GuoCu_data/processed_data/feature/user/user_inter_login.csv'
output_file_path = '/data/GuoCu_data/processed_data/feature/user/user_features.csv'

# 读取文件
try:
    click_df = pd.read_csv(click_file_path)
    login_df = pd.read_csv(login_file_path)
except FileNotFoundError as e:
    print(f"文件读取错误: {e}")
    exit(1)

# 合并两个文件内容（基于ip）
merged_df = pd.merge(login_df, click_df, on='ip', how='outer')

# 可选：处理合并后的缺失值（根据实际需求调整）
merged_df.fillna({
    'user_total_clicks': 0,
    'user_click_ts_diff_min': -1,
    'user_click_ts_diff_mean': -1,
    'user_click_ts_diff_std': -1,
    'user_click_ts_diff_max': -1,
    'user_click_ts_hour_mean': -1,
    'user_last_click_time': pd.NaT,  # 新增字段
    'user_login_count_7d': 0,
    'user_is_login_3d': 0
}, inplace=True)

# 将合并后的数据保存为新文件
merged_df.to_csv(output_file_path, index=False)
